首页> 外文OA文献 >Incremental Query Processing on Big Data Streams
【2h】

Incremental Query Processing on Big Data Streams

机译:大数据流上的增量查询处理

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This paper addresses online query processing for large-scale, incrementaldata analysis on a distributed stream processing engine (DSPE). Our goal is toconvert any SQL-like query to an incremental DSPE program automatically. Incontrast to other approaches, we derive incremental programs that returnaccurate results, not approximate answers. This is accomplished by retaining aminimal state during the query evaluation lifetime and by using incrementalevaluation techniques to return an accurate snapshot answer at each timeinterval that depends on the current state and the latest batches of data. Ourmethods can handle many forms of queries on nested data collections, includingiterative and nested queries, group-by with aggregation, and equi-joins.Finally, we report on a prototype implementation of our framework, called MRQLStreaming, running on top of Spark and we experimentally validate theeffectiveness of our methods.
机译:本文介绍了在分布式流处理引擎(DSPE)上进行大规模增量数据分析的在线查询处理。我们的目标是将任何类似SQL的查询自动转换为增量DSPE程序。与其他方法相反,我们得出的增量程序返回的是准确的结果,而不是近似的答案。这是通过在查询评估生存期内保留最小状态并使用增量评估技术在每个时间间隔(取决于当前状态和最新一批数据)返回准确的快照答案来实现的。我们的方法可以处理嵌套数据集合上的多种形式的查询,包括迭代和嵌套查询,聚合汇总和等联接。最后,我们报告了在Spark上运行的名为MRQLStreaming的框架的原型实现。实验上验证了我们方法的有效性。

著录项

  • 作者

    Fegaras, Leonidas;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号